QuestionC.java example

Explorer

CtCI-6th-Edition-master
- Java
  - Big O
    - Example_16
      - Example.java
    - QVI_11_Print_Sorted_Strings
      - Question.java
  - Ch 01. Arrays and Strings
    - Q1_01_Is_Unique
    - Q1_02_Check_Permutation
      - QuestionA.java
      - QuestionB.java
    - Q1_03_URLify
      - Question.java
    - Q1_04_Palindrome_Permutation
    - Q1_05_One_Away
    - Q1_06_String_Compression
    - Q1_07_Rotate_Matrix
      - Question.java
    - Q1_08_Zero_Matrix
    - Q1_09_String_Rotation
      - Question.java
  - Ch 02. Linked Lists
    - Q2_01_Remove_Dups
    - Q2_02_Return_Kth_To_Last
    - Q2_03_Delete_Middle_Node
      - Question.java
    - Q2_04_Partition
    - Q2_05_Sum_Lists
    - Q2_06_Palindrome
    - Q2_07_Intersection
      - Question.java
    - Q2_08_Loop_Detection
      - Question.java
  - Ch 03. Stacks and Queues
    - Introduction
    - Q3_01_Three_in_One
    - Q3_02_Stack_Min
    - Q3_03_Stack_of_Plates
    - Q3_04_Queue_via_Stacks
      - MyQueue.java
      - Question.java
    - Q3_05_Sort_Stack
      - Question.java
    - Q3_06_Animal_Shelter
  - Ch 04. Trees and Graphs
    - Introduction
      - Traversals.java
    - Q4_01_Route_Between_Nodes
    - Q4_02_Minimal_Tree
      - Question.java
    - Q4_03_List_of_Depths
      - QuestionBFS.java
      - QuestionDFS.java
    - Q4_04_Check_Balanced
      - QuestionBrute.java
      - QuestionImproved.java
    - Q4_05_Validate_BST
    - Q4_06_Successor
      - Question.java
    - Q4_07_Build_Order
      - DFS
        Graph.java
        Project.java
        Question.java
      - EdgeRemoval
        Graph.java
        Project.java
        Question.java
    - Q4_08_First_Common_Ancestor
    - Q4_09_BST_Sequences
      - Question.java
    - Q4_10_Check_Subtree
      - QuestionA.java
      - QuestionB.java
    - Q4_11_Random_Node
    - Q4_12_Paths_with_Sum
  - Ch 05. Bit Manipulation
    - Q5_01_Insertion
      - Question.java
    - Q5_02_Binary_to_String
      - Question.java
    - Q5_03_Flip_Bit_to_Win
    - Q5_04_Next_Number
    - Q5_06_Conversion
    - Q5_07_Pairwise_Swap
      - Question.java
    - Q5_08_Draw_Line
      - Question.java
    - Sample_Code
      - RightShifts.java
      - Sample_Code.java
  - Ch 06. Math and Logic Puzzles
    - Introduction
      - PrimeNumbers.java
      - SieveOfEratosthenes.java
    - Q6_05_Egg_Drop
      - Question.java
    - Q6_07_The_Apocalypse
      - Question.java
    - Q6_10_Test_Strips
  - Ch 07. Object-Oriented Design
    - Q7_01_Deck_of_Cards
    - Q7_02_Call_Center
    - Q7_03_Jukebox
    - Q7_04_Parking_Lot
    - Q7_05_Online_Book_Reader
    - Q7_06_Jigsaw
    - Q7_07_Chat_Server
    - Q7_08_Othello
    - Q7_09_Circular_Array
      - CircularArray.java
      - Question.java
    - Q7_10_Minesweeper
    - Q7_11_File_System
    - Q7_12_Hash_Table
  - Ch 08. Recursion and Dynamic Programming
    - Introduction
    - Q8_01_Triple_Step
    - Q8_02_Robot_in_a_Grid
    - Q8_03_Magic_Index
      - Question.java
      - QuestionB.java
    - Q8_04_Power_Set
      - QuestionA.java
      - QuestionB.java
    - Q8_05_Recursive_Multiply
    - Q8_06_Towers_of_Hanoi
      - Question.java
      - Tower.java
    - Q8_07_Permutations_Without_Dups
    - Q8_08_Permutations_With_Dups
      - Question.java
    - Q8_09_Parens
      - QuestionA.java
      - QuestionB.java
    - Q8_10_Paint_Fill
      - Question.java
    - Q8_11_Coins
    - Q8_12_Eight_Queens
      - Question.java
    - Q8_13_Stack_of_Boxes
    - Q8_14_Boolean_Evaluation
  - Ch 09. Scalability and Memory Limits
    - Q9_02_Social_Network
    - Q9_05_Cache
  - Ch 10. Sorting and Searching
    - Introduction
    - Q10_01_Sorted_Merge
      - Question.java
    - Q10_02_Group_Anagrams
    - Q10_03_Search_in_Rotated_Array
      - Question.java
    - Q10_04_Sorted_Search_No_Size
      - Arrayish
        Listy.java
        Question.java
    - Q10_05_Sparse_Search
      - QuestionA.java
      - QuestionB.java
    - Q10_07_Missing_Int
      - QuestionA.java
      - QuestionB.java
    - Q10_08_Find_Duplicates
      - BitSet.java
      - Question.java
    - Q10_09_Sorted_Matrix_Search
    - Q10_10_Rank_from_Stream
    - Q10_11_Peaks_and_Valleys
  - Ch 13. Java
    - Introduction
    - Q13_01_Private_Constructor
      - Question.java
    - Q13_05_TreeMap_HashMap_LinkedHashMap
      - Question.java
    - Q13_06_Object_Reflection
      - Question.java
      - Rectangle.java
    - Q13_07_Lambda_Expressions
    - Q13_08_Lambda_Random
  - Ch 15. Threads and Locks
    - IntroductionA
      - ExampleA.java
      - RunnableThreadExample.java
    - IntroductionB
      - ExampleB.java
      - ThreadExample.java
    - IntroductionLocks
    - IntroductionSynchronization
    - IntroductionSynchronizedBlocks
    - IntroductionWaitNotify
    - Q15_03_Dining_Philosophers
      - QuestionA
        Chopstick.java
        Philosopher.java
        Question.java
      - QuestionB
        Chopstick.java
        Philosopher.java
        Question.java
    - Q15_04_Deadlock_Free_Class
    - Q15_05_Call_In_Order
    - Q15_06_Synchronized_Methods
    - Q15_07_FizzBuzz
  - Ch 16. Moderate
    - Q16_01_Number_Swapper
      - Question.java
    - Q16_02_Word_Frequencies
      - QuestionA.java
      - QuestionB.java
    - Q16_03_Intersection
      - Line.java
      - Point.java
      - Question.java
    - Q16_04_Tic_Tac_Win
      - Piece.java
      - Position.java
      - PositionIterator.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - QuestionE.java
      - QuestionF.java
      - QuestionG.java
      - QuestionH.java
      - Tester.java
    - Q16_05_Factorial_Zeros
      - QuestionA.java
      - QuestionB.java
    - Q16_06_Smallest_Difference
      - QuestionA.java
      - QuestionB.java
      - Tester.java
    - Q16_07_Number_Max
      - Question.java
    - Q16_08_English_Int
      - Question.java
    - Q16_09_Operations
      - Question.java
    - Q16_10_Living_People
      - Person.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Tester.java
    - Q16_11_Diving_Board
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Tester.java
    - Q16_12_XML_Encoding
      - Attribute.java
      - Element.java
      - QuestionOO.java
      - QuestionString.java
    - Q16_13_Bisect_Squares
      - Line.java
      - Point.java
      - Question.java
      - Square.java
    - Q16_14_Best_Line
      - GraphPoint.java
      - Line.java
      - Question.java
    - Q16_15_Master_Mind
      - Question.java
    - Q16_16_Sub_Sort
      - Question.java
    - Q16_17_Contiguous_Sequence
      - Question.java
    - Q16_18_Pattern_Matcher
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Tester.java
    - Q16_19_Pond_Sizes
      - QuestionA.java
      - QuestionB.java
    - Q16_20_T9
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
    - Q16_21_Sum_Swap
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Tester.java
    - Q16_22_Langtons_Ant
      - Ant.java
      - Board.java
      - Grid.java
      - Orientation.java
      - Position.java
      - Question.java
    - Q16_23_Rand7_From_Rand5
      - Question.java
      - QuestionB.java
    - Q16_24_Pairs_With_Sum
      - Pair.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Tester.java
    - Q16_25_LRU_Cache
      - Cache.java
      - Question.java
    - Q16_26_Calculator
      - Operator.java
      - QuestionA.java
      - QuestionB.java
      - Term.java
  - Ch 17. Hard
    - Q17_01_Add_Without_Plus
      - QuestionA.java
      - QuestionB.java
      - Tester.java
    - Q17_02_Shuffle
      - Question.java
    - Q17_03_Random_Set
      - Question.java
      - QuestionAlternate.java
    - Q17_04_Missing_Number
      - BitInteger.java
      - Question.java
    - Q17_05_Letters_and_Numbers
      - QuestionA.java
      - QuestionB.java
      - Tester.java
    - Q17_06_Count_of_2s
      - Question.java
      - QuestionBrute.java
    - Q17_07_Baby_Names
      - Graph.java
      - GraphNode.java
      - NameSet.java
      - QuestionA.java
      - QuestionB.java
    - Q17_08_Circus_Tower
      - HtWt.java
      - QuestionA.java
      - QuestionB.java
      - QuestionOld.java
      - Tester.java
    - Q17_09_Kth_Multiple
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
    - Q17_10_Majority_Element
      - QuestionA.java
      - QuestionB.java
    - Q17_11_Word_Distance
      - LocationPair.java
      - QuestionA.java
      - QuestionB.java
      - Tester.java
    - Q17_12_BiNode
      - BiNode.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
    - Q17_13_ReSpace
      - ParseResult.java
      - QuestionA.java
      - QuestionB.java
    - Q17_14_Smallest_K
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Tester.java
    - Q17_15_Longest_Word
      - LengthComparator.java
      - Question.java
    - Q17_16_The_Masseuse
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Tester.java
    - Q17_17_Multi_Search
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Trie.java
      - TrieNode.java
    - Q17_18_Shortest_Supersequence
      - HeapNode.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - QuestionD.java
      - Range.java
      - Tester.java
    - Q17_19_Missing_Two
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
    - Q17_20_Continuous_Median
      - MaxHeapComparator.java
      - MinHeapComparator.java
      - Question.java
    - Q17_21_Volume_of_Histogram
      - HistogramData.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Tester.java
    - Q17_22_Word_Transformer
      - BFSData.java
      - PathNode.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Tester.java
    - Q17_23_Max_Black_Square
      - Question.java
      - QuestionEff.java
      - SquareCell.java
      - Subsquare.java
    - Q17_24_Max_Submatrix
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Range.java
      - SubMatrix.java
      - Tester.java
    - Q17_25_Word_Rectangle
      - Question.java
      - Rectangle.java
      - WordGroup.java
    - Q17_26_Sparse_Similarity
      - DocPair.java
      - Document.java
      - QuestionA.java
      - QuestionB.java
      - QuestionC.java
      - Tester.java
  - CtCILibrary
    - CtCILibrary
  - Introduction
    - Big_O
    - CompareBinaryToHex
      - CompareBinaryToHex.java
    - SwapMinMax
      - SwapMinMax.java

package Q17_26_Sparse_Similarity;

import java.util.ArrayList;
import java.util.Collections;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Map.Entry;

import CtCILibrary.AssortedMethods;

public class QuestionC {
	public static class Element implements Comparable<Element> {
		public int word;
		public int document;
		public Element(int w, int d) {
			word = w;
			document = d;
		}
		
		public int compareTo(Element e) {
			if (word == e.word) {
				return document - e.document;
			}
			return word - e.word;
		}
	}
	
	public static HashMap<DocPair, Double> computeSimilarities(HashMap<Integer, Document> documents) {
		ArrayList<Element> elements = sortWords(documents);
		HashMap<DocPair, Double> similarities = computeIntersections(elements);
		adjustToSimilarities(documents, similarities);
		return similarities;
	}	
	
	/* Throw all words into one list, sorting by the word then the document. */
	public static ArrayList<Element> sortWords(HashMap<Integer, Document> docs) {
		ArrayList<Element> elements = new ArrayList<Element>();
		for (Document doc : docs.values()) {
			ArrayList<Integer> words = doc.getWords();
			for (int word : words) {
				elements.add(new Element(word, doc.getId()));
			}
		}
		Collections.sort(elements);
		return elements;
	}
	
	/* Increment the intersection size of each document pair. */
	public static void increment(HashMap<DocPair, Double> similarities, int doc1, int doc2) {
		DocPair pair = new DocPair(doc1, doc2);
		if (!similarities.containsKey(pair)) {
			similarities.put(pair, 1.0);
		} else {
			similarities.put(pair, similarities.get(pair) + 1);		
		}
	}
	
	/* Adjust the intersection value to become the similarity. */
	public static HashMap<DocPair, Double> computeIntersections(ArrayList<Element> elements) {
		HashMap<DocPair, Double> similarities = new HashMap<DocPair, Double>();
		
		for (int i = 0; i < elements.size(); i++) {
			Element left = elements.get(i);
			for (int j = i + 1; j < elements.size(); j++) {
				Element right = elements.get(j);
				if (left.word != right.word) {
					break;
				}
				increment(similarities, left.document, right.document);	
			}
		}
		
		return similarities;
	}
	
	/* Adjust the intersection value to become the similarity. */
	public static void adjustToSimilarities(HashMap<Integer, Document> documents, HashMap<DocPair, Double> similarities) {
		for (Entry<DocPair, Double> entry : similarities.entrySet()) {
			DocPair pair = entry.getKey();
			Double intersection = entry.getValue();
			Document doc1 = documents.get(pair.doc1);
			Document doc2 = documents.get(pair.doc2);
			double union = (double) doc1.size() + doc2.size() - intersection;
			entry.setValue(intersection / union);
		}
	}
	
	public static void main(String[] args) {
		int numDocuments = 10;
		int docSize = 5;
		HashMap<Integer, Document> documents = new HashMap<Integer, Document>();
		for (int i = 0; i < numDocuments; i++) {
			int[] words = AssortedMethods.randomArray(docSize, 0, 10);
			ArrayList<Integer> w = Tester.removeDups(words);
			System.out.println(i + ": " + w.toString());
			Document doc = new Document(i, w);
			documents.put(i, doc);
		}
		
		HashMap<DocPair, Double> similarities = computeSimilarities(documents);
		Tester.printSim(similarities);
	}

}